模型

内置AI大模型的小米智能音箱,到底有多“懂你”?

在当今科技飞速发展的时代,智能音箱已经成为了许多家庭不可或缺的一部分。加上现在智能家居的发展,智能音箱已经成为了一个前端入口,很多时候控制智能家居,仅需一句“小爱同学,帮我打开XXX”就可以了。作为科技领域的知名品牌,小米的智能音箱一直以来口碑都是非常不错的,

模型 小米 智能 音箱 倒相管 2025-10-20 09:58  12

多模态大模型学会反思和复盘,上交&上海AI Lab破解多模态复杂推理

无论是生成代码、分析图表还是回答问题,诸多多模态大模型(MLLM)都倾向于给出一个“一步到位”的答案。它们就像一个从不检查作业的“学霸”,虽然知识渊博,但一旦在复杂的、需要反复试错的问题上走错一步,就很难回头。这种能力的缺失,正是阻碍AI从“知识容器”迈向“问

模型 模态 推理 复盘 lab 2025-10-19 14:48  13

NeuTTS Air 实时语音克隆模型

NeuTTS Air是由Neuphonic于2025年10月推出的突破性文本转语音(TTS)技术,它在可访问性和隐私保护方面实现了重大进步。这个开源模型采用Apache 2.0许可证,能够在日常设备如笔记本电脑、智能手机和树莓派上实时进行语音合成,而无需依赖云

模型 语音 克隆 neutts neuttsair 2025-10-19 07:04  10

PaddleOCR-VL开源文档解析模型 (0.9B)

您是否曾被文档解析的复杂性所困扰?无论是处理扫描合同、从财务报告中提取表格,还是识别论文中的公式,传统的 OCR 工具在面对多样化的布局和复杂的元素时,往往不堪重负。更何况,那些高效的大型模型往往拥有数百甚至数百亿个参数,这使得本地部署和高效推理成为一种奢望。

模型 开源 python pip wsl 2025-10-19 06:53  11

IDEA研究院等机构开发类人思考AI助手

这项由IDEA研究院(国际数字经济研究院)的吴晓军、杨策豪、林学远等研究人员与香港科技大学(广州)、DataArc Tech Ltd等机构联合开展的研究,于2025年9月发表在arXiv预印本平台上(论文编号:2509.21710v1)。有兴趣深入了解的读者可

模型 推理 开发 研究院 idea 2025-10-18 00:36  9

科学家发现:大模型存在无法逾越的理论上限,多智体是未来

人工智能领域正在经历一场关于模型能力边界的根本性反思。来自阿联酋穆罕默德·本·扎耶德人工智能大学和保加利亚INSAIT研究所的最新研究揭示了一个令人不安的事实:无论如何优化训练数据或调整架构参数,单一大模型在处理复杂任务时都存在一个无法逾越的理论上限。这一发现

模型 科学家 推理 多智能体 信息论 2025-10-18 18:14  11

讲座预告|大语言模型赋能城市研究与可视化

社会网络分析的流派与发展主讲人:韩亦(华中师范大学社会学院教授)主持人:夏彧(华东师范大学国家教育宏观政策研究院副研究员)与谈人:王绯烨(华东师范大学教育管理学系副教授)、谢晨(华东师范大学教育管理学系副教授)时间:2025年10月17日(周五)14:00主办

模型 可视化 讲座 研究 语言 2025-10-18 01:05  12

微言 | 从“解惑”变“带货”:AI回答也藏广告,数据筛选困局怎么破?

有用户询问AI“现在开空调是否省电”,得到的回答中却夹杂着某空调品牌的信息。最近,有网友在社交平台反映,当前部分AI大模型的回答中已出现明显的商业广告信息;还有网友晒图称,向AI咨询某地旅游方式时,回答结尾处甚至附带了当地导游的联系方式。

模型 seo 广告 祛魅 搜索引擎优化 2025-10-18 12:04  10